# 打开文件
from bs4 import BeautifulSoup

with open('district.html', 'r', encoding='utf-8') as file:
    # 读取文件内容
    html_content = file.read()

# 打印文件内容
# print(html_content)

# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(html_content, 'html.parser')

tags_panel = soup.find('div', class_='tags-panel')

# 查找所有class为'tags-line tags-line-border'且data-type为'district'的<li>标签
district_tags = tags_panel.find('li', class_='tags-line tags-line-border', attrs={'data-type': 'district'})


# 遍历找到的标签并打印它们的内容或属性
# for tag in district_tags:
    # 打印标签的文本内容
    # print(tag.text.strip())
    # 如果需要打印整个标签的属性等详细信息，可以用str(tag)或tag.attrs来查看

# 查找所有的 li 标签
li_tags = district_tags.find_all('li')

# 遍历每个 li 标签
for li in li_tags:
    # 获取 li 标签的 class 属性值
    class_value = li.get('class')

    # 获取 a 标签
    a_tag = li.find('a')

    # 获取 a 标签的文本内容
    text = a_tag.text.strip()

    # 获取 a 标签的其他属性值
    data_act = a_tag.get('data-act')
    data_val = a_tag.get('data-val')
    href = a_tag.get('href')
    data_bid = a_tag.get('data-bid')

    # 输出详细信息
    print("class:", class_value)
    print("text:", text)
    print("data-act:", data_act)
    print("data-val:", data_val)
    print("href:", href)
    print("data-bid:", data_bid)
    print("----------------------------------")
